Рынок заведений общественного питания Москвы

Инвесторы из фонда «Shut Up and Take My Money» решили попробовать себя в новой области и открыть заведение общественного питания в Москве. Заказчики ещё не знают, что это будет за место: кафе, ресторан, пиццерия, паб или бар, — и какими будут расположение, меню и цены.

Цель: исследовать рынок Москвы, найти интересные особенности и презентовать полученные результаты, которые в будущем помогут в выборе подходящего инвесторам места.

Задачи:

Описание данных:

Доступен датасет с заведениями общественного питания Москвы, составленный на основе данных сервисов Яндекс Карты и Яндекс Бизнес на лето 2022 года.

Файл moscow_places.csv:


Изучение данных и их предобработка

До начала исследования необходимо изучить и подготовить данные к работе.

Итак, всего у нас 8406 заведений. Во всех заведениях известно наименование, категория, метоположение, рейтинг и является ли заведение сетевым. Однако не все заведения указывают часы работы, количество мест и цены в своих заведениях. Данные содержат 3 типа: object, int64, float64

Явных дубликатов нет, однако присутствуют множественные пропуски. К сожалению, обработать большую часть их них невозможно. Рабочие часы и количество мест зависит от помещения и внутреннего устава компаний. Столбцы middle_avg_bill и middle_coffee_cup не могут быть заполнены из-за отсутствия статистики. Также многие компании могли не заполнять столбец middle_coffee_cup, так как не являются кофейнями. Стоит проверить, можем ли мы заполнить хотя бы пропуски в столбце price, опираясь на столбец avg_bill. Для этого проверим есть ли закономерности между средними ценами и самим статусом ценового сегмента.

В теории можно заполнить пропусков:

Посмотрим есть ли закономерности.

К сожалению, нельзя точно сказать как распределены группы. Среди высоких цен может быть средний чек от 700, среди категорий выше среднего могут быть средние счера в 250-500 рублей и так далее. Из-за этих пересечений нельзя утверждать, что по среднему счёту можно сразу определить категорию.

Пропуски стоит оставить, чтобы избежать искажения данных. Явных дубликатов не выявлено.

Для дальнейшей работы также необходимо создать несколько столцов:

Создание функций для графиков

Итак, в ходе данного раздела мы посмотрели структуру данных, убедились, что нет явных дубликатов и посмотрели пропуски. Также были добавлены столбцы с улицей и информацией о том, является ли заведение круглосуточным. также созданы функции для графиков.

Анализ данных

Теперь можно приступить к анализу данных. Для этого стоит сделать:

Исследование категорий заведений

Начнём с исследования категорий.

До начала определим сколько у нас заведений разных категорий. Для удобства представим результат в видк круговой диаграммы:

Итак, больше всего в Москве кафе, на втором месте ресторане, на третьем кофейни.

Теперь проверим, как распределены категории по районам Москвы.

Больше всего выделяется центральный округ. Там больше всего заведений и больше всего именно рестиранов. Кафе во всех регионах лежат в дианопозе от 200 до 500. Также можно заметить, что больше всего пабов именно в центральном районе.

Обычно в городах бывают улицы, где больше всего определённых заведений, например в СПб улица Рубенштейна известна как "улица баров". Выявим, есть ли подобные улицы в Москве. Будем считать, что соотношение верно, если хотя бы 5% заведений от общего количества находятся на конкретной улице.

По имеющимся данным не удалось выявить зависимость улиц и категорий заведений.

Теперь проверим количество посадочных мест по категориям. До начала вывелем среднее и медианное значения, чтобы понять, как они различаются. Затем построим heatmap, чтобы понять, как среднее количество мест по категориям зависит от: местоположения(района) ,сети и круглосуточности.

Можно заметить, что среднее и медианные значения достаточно сильно отличаются. Посмотрим по графикам от каких параметров может зависеть.

В среднем больше всего посадочных мест в барах и рестоанах, при этом самое большое количество мест в Западном округе. Из несетых заведений больше всего посадочных мест также в рестаранах и пабах, а в сетевых заведениях лидируют рестораны, однако также много посадочных мест в кофейнях. В среднем в круглосуточных ресторанах больше всего мест, а не в круглосуточных больше всего мест в барах.

Теперь изучим рейтинги заведений по категориям.

Теперь визуализируем рейтинги.

Как можно заметить, все средние рейтинги выше 4 баллов, однако у быстрого питания они самые низкие. В среднем, самые высокие рейтинги у баров и пабов.

После изучения категории заведений можно сделать следующие выводы:

Исследование сетевых заведений

На данном этапе стоит рассмотреть сетевые заведения. Рассмотреть сколько их по отношению к несетевым и посмотреть, как зависит сеть от разных параметров.

Сетевых заведений 38,1% от общего числа заведений.

Теперь рассмотрим сами сетевые заведения.

Итак, больше всего сетевых заведений являются кафе, кофейнями и ресторанами и больше всего их расположено в центральном районе. Зачастую они не круглосуточные.

Теперь рассмотрим несетевые заведения.

Несетевыми часто являются некруглосуточные кафе в ценральном районе

Итак,

Теперь изучим сами заведения. В дальнейшем будем рассматривать только сетевые, т.е. использовать таблицу chain_places.

До начала выведем топ-15 сетевых заведений

Итак, самыми популярными по Мск являются Шоколадница, Домино'с пицца и Додо Пицца

Теперь посмотрим на категории этих заведений.

Как было выяснено ранее, больше всего ресторанов, кафе и кофеен, однако также есть 2 большие сети пиццерий по городу. Вероятнее всего это связано с размером этих сетей, значит конкурировать с ними будет сложно.

Изучение районов и улиц

Не менее важно рассмотреть информацию по районам города.

Построим графики распределения категорий по районам.

В северном, восточном, юго-восточном, юго-западном и северо-восточном районах больше всего кафе, в северо-западном, южном и западном больше всего кафе и ресторанов, в центральном больше всего ресторанов

Также можно рассмотреть рейтинги по регионам.

Самые высокие рейтинги в Центральном регионе, самые низкие в Юго-Восточном

Теперь рассмотрим рейтинги по районам.

Здесь уже видна разница. Рейтинги у быстрого питания в некоторых районах ниже 4. Самые высокие оценки в Центральном районе, но даже в здесь оценки у быстрого питания самые низкие. Оценки выше 4,4 есть у баров, пиццерий и ресторанов. Средние оценки у кафе не в центральном районе ниже 4,3.

Однако среднее значение не всегда показательно. Рассмотрим также медианное значение рейтинга по регионам.

Самые хорошие рейтинги в Центральном районе.

Теперь изучим улицы Москвы. Для этого выведем все заведения на карте с помощью кластеров, затем найдём топ-15 улиц по количеству заведений. Далее найдём улицы, на которых находится только один объект общепита.

Составим топ-15 улиц

Построим график распределения количества заведений и их категорий по улицам.

Как уже было выяснено ранее, по имеющимся данным нет улицы определённой категории. Однако можно выявить следующие закономерности:

Больше всего кафе на улицах: МКАД, проспект Мира,Профсоюзная улица, Люблинская улица. Больше всего ресторанов: Ленинградское шоссе, Ленинградский проект, Ленинский проект, Пятницкая улица, проспект Вернадского. Больше всего кафе и ресторанов: Дмитровское шоссе, Кутузовский проект, улица Вавилова, Варшавское шоссе, Каширское шоссе.

Однако важно помнить, что не всегда количество заведений определяет то, популярна ли она в плане питания в общем. Стоит посмотреть на размеры улиц, чтобы узнать, на каких улицах много заведений потому что они популярны, а на каких много заведений, потому что они большие.

Как можно заметить, МКАД появился в топе не из-за насыщенности заведениями, а из-за своего размера. Также большими можно назвать Дмитровское шоссе и Варшавское шоссе, однако лидеры топа, например проспект Мира, Профсоюзная улица, проспект Вернадского, Ленинский проспект, относительно Москвы не большие. Поэтому их по-прежнему можно считать популярными.

Теперь изучим улицы, на которых находится только 1 заведение.

Теперь проверим на рейтинги этих заведений.

Рейтинги в некоторых районах отсутствуют

Можно заметить, что рейтинги достаточно высокие. Вероятнее всего это связано с тем, что у посетителей нет альтернатив. Возможно, открывать заведение на таких улицах будет выгодно в плане рейтинга.

Теперь посмотрим, как связан рейтинг, сети и категории.

У сетевых баров достаточно высокие рейтинги. Вероятнее всего конкурировать с ними будет сложно.

Рассмотрим рейтинг по круглосуточности

Если у некруглосуточных заведений на этих улицах рейтинг может колебаться от 4.1 до 4.5. В круглосуточных отсутствует рейтинг у пиццерий и столовых. Самый высокий рейтинг у баров

Теперь рассмотрим медианную стоимость заказа по районам.

В центральном районе, западных и в юго-западных районах цены самые высокие. В других регионах цены значительно ниже. То есть чем дальше район от центра, тем ниже цены во всех направлениях, кроме западного и юго-западного.

Выводы раздела:

  • Больше всего по Мск кафе, ресторанов и кофеен.
  • Самый популярный район – Центральный.
  • В Мск нет улиц, которые бы отличались количеством определённых мест.
  • Больше всего посадочных мест нужно чтобы открыть ресторан или бар. Меньше всего мест нужно для булочных.
  • По категориями средний рейтинг не сильно отличается, однако у быстрого питания они ниже всего, а у баров выше всего.
  • Большая часть заведений – несетевые, 38,1% круглосуточные.
  • Большая часть заведений – некруглосуточные.
  • Самыми популярными по Мск являются заведения: Шоколадница, Домино'с пицца и Додо Пицца.
  • По всем данным больше всего кафе, ресторанов и кофеен. Пиццерии вероятнее всего являются олигополией, поэтому конкурировать с ними будет сложно.
  • В центральном районе очень много ресторанов. В остальные районах больше предпочитают кафе, но ресторанов также много.
  • Самые высокие рейтинги в Центральном районе, самые низкие в Юго-Восточном.
  • Самой большой по количеству заведений является улица проект Мира. На ней, как и на многих других улицах больше всего кафе. Также на многих улицах большое количестве ресторанов.
  • На 458 улицах находится только 1 заведение. На этих улицах, у некруглосуточных заведений рейтинг примерно одинаковый, а у круглосуточных самый высокий у баров, пиццерий и столовых. У сетевых заведений высокий рейтинг у баров. Рейтинги относительно общих данных достаточно высокие. Особенно выделяются булочные, пиццерии и бары.
  • Самые высокие цены не только в центральном районе. Также высокие цены в западном и юго-западных районах. Однако в остальных случаях цены ниже, чем в центральном районе.

  • Детализируем исследование: открытие кофейни

    Мечта заказчика - окрыть кофейню. Конкуренции они не бояться, поэтому рассматривать олигополию пиццерий не нужно.

    В данном разделе будут даны ответы на следующие вопросы:

    Рассмотрим их распределение по районам.

    Для удобства посмотрим на карте.

    Больше всего кофеен в центре. В остальных районах их количество от 50 до 200 заведений на район.

    Изучим круглосуточные кофейни.

    Посмотрим как их количество зависит от района.

    Больше всего круглосуточных кофеен в центре. В остальных районах их почти нет. Однако некоторое количество присутствует в районах с большими ценами: западном и юго-западном

    Изучим рейтинги кофеен.

    Посмотрим как рейтинги распределены на карте.

    В западном районе самые низкие рейтинги

    Дополнительно изучим количество посадочных мест.

    Самые большое кофейни в западном районе.

    Рассмотрим стоимость чашки капучино.

    Рекомендации:

  • Самое большое количество кофеен, как не удивительно, в центре. меньше всего их на северо-востоке. Если следовать принципу: чем больше заведений, тем выше спрос, то центр - идеальное место для открытия кофейни.
  • Очень мало круглосуточных кофеен в районе кроме центрального. Нет смысла искать персонал и оборудовать всё под круглосуточное заведение, так как конкурентного преимущества по сути это не даст. Люди, которые живут или ездят в центр ночью наверняка знают, что большая часть кофеен находится именно в центре и не будут замечать новую круглосуточную кофейню на окраине. Если же открывать кофейню в центре, то здесь стоит ичитывать тот факт, что ночью мало кто предпочтёт пить кофе. В основном все идёт в бары или рестораны. Поэтому даже в центре нет смысла открывать круглосуточную кофейню.
  • Самые большие и самые низкие по рейтингам кофейни находятся в западном районе. Стоит избегать данный район, так как окрывать большую кофейню изначально - не очень хорошая идея, а низкие рейтинги могут привести к тому, что кофейня потеряет посетителей и разорится.
  • Стоимость чашки капучино должна быть в среднем от 170 до 175 рублей. Такая цена позволит сохранять конкурентоспособность, так как она не будет в низком ценовом сигменте и не будет в высоком.

  • Презентация

    https://disk.yandex.ru/d/iqmMXNZYltv3dQ


    Выводы

    В ходе данной работы были проделаны следующие шаги:

    Найденные закономерности и рекомендации:

  • самые популярные виды заведений: кафе, ресторан и кофейни. Видимо, они пользуются наибольшим спросом. Поэтому открытие кофейни - отличная идея;
  • вероятнее всего пиццерии образуют олигополию, из-за которой будет трудно с ними конкурировать;
  • в Москве нет улицы, которая бы отличалась определённым видом заведений. Однако, самая популярная улица - Проект Мира;
  • лучше всего открывать кофейню в Центральном районе, так как там больше всего заведений (при учёте, что заказчик не боится конкуренции);
  • стоит избегать Западного района для открытия кофейни, так как там нужно открывать большую кофейню, также так самые низкие рейтинги, что может отталнуть потенциальных клиентов;
  • стоит ориентироваться на количество мест от 65;
  • средняя цена на капучино должна быть от 170 до 175 рублей;
  • кофейня не обязательно должна быть круглосуточной.